{
 "cells": [
  {
   "cell_type": "code",
   "execution_count": 1,
   "metadata": {},
   "outputs": [],
   "source": [
    "additional = \"\"\"\n",
    "pisa - pisau \n",
    "kograng - alat kukur kelapa \n",
    "payyang - tempayan \n",
    "sejeik - masjid \n",
    "beng ikang - van yang bawa ikan bala \n",
    "soh - surau \n",
    "lembek - tilam \n",
    "kalang - pensil \n",
    "woh hulu - kueh bahulu \n",
    "sorok - laci/drawer \n",
    "anok branok - anak beranak \n",
    "bata golek - bantal peluk yang panjang \n",
    "ppuang - perempuan \n",
    "pelawok -penipu \n",
    "nisang - gula melaka air geh tujuh yu pi cak katong jogek - air 7UP (gambar fido dido menari2)- bahasa kuala berang \n",
    "taik ayang muna - tahi ayam cair (warna coklat) \n",
    "plastik ghokghak/jabir/ghajuk - plastik \n",
    "ikang aye - ikan tongkol \n",
    "rokok cak kude nabai - maksudnya rokok camel (kuala berang punya bahasa la tu...) \n",
    "kkatok wong - maksudnya katak la\n",
    "tubek - keluar \n",
    "derak - keluar berjalan-jalan \n",
    "kelek wak lari - kendong bawa lari \n",
    "glebek yeng - gatal (mcm mengada-ngada la) \n",
    "Senyum Sokmo - Senyum Selalu \n",
    "ngerek awek - bawa awek \n",
    "jereba - terkam \n",
    "tohok - buang \n",
    "nyakik nyamang - jaga tepi kain \n",
    "bahang/tibang/godang - pukul \n",
    "musing ketang - berpusing (seolah-oleh pening) \n",
    "keloh - berkelah \n",
    "kutir - cubit yang menyakitkan (cubit halus) \n",
    "cobek - cuil (contohnya cubit kuih sedikit) \n",
    "'gugha bewok - bergurau yang melampau (boleh menyebabkan pergaduhan) \n",
    "nye nyeh - mengejek (dalam bergurau)  \n",
    "top pi lang kace (tutup api dalam kaca) - bahasa kuala berang - Tutup lampu \n",
    "mamoh - kunyah \n",
    "kekoh - gigit \n",
    "belebe beghong - membebel (kuat membebel) \n",
    "ranggoh/kedaghoh - makan dengan gelojoh  \n",
    "kellong/plekong - baling (contohnya baling batu)  \n",
    "Hungga - menerpa \n",
    "gateh/gohek - kayuh basikal \n",
    "kona lepe - corner \n",
    "baring kehek - keluarkan semula dari mulut  \n",
    "gege- bising (org klate pun panggil 'gege' gak)\n",
    "gelak guguk - sangat gelap (tak nampak apa) \n",
    "tupol glebek - sangat tumpul \n",
    "hudoh sepang ko' ong - sangat2 hodoh \n",
    "bising bango - sangat bising \n",
    "pucak lesi/pucak kesi - sangat pucat \n",
    "kecik tuwe'/kecik tuek - sangat kecil \n",
    "beso jallo - sudah besar/dah dewasa (orang) \n",
    "tinggi sayuk - amat tinggi \n",
    "pahik lepang - sangat pahit \n",
    "panah ketik - sangat panas (api) \n",
    "kecok - korang tengok kalau org sakit sebelah kaki mcm mana dorg berjalan.. itu la dinamakan kecok \n",
    "boloq woq - serabut (keadaan) \n",
    "sikat neting - sangat singkat (kain) \n",
    "serabut perok - sangat serabut (perasaan) \n",
    "atah lambo - atas beranda \n",
    "atah retok - atas titi \n",
    "keleik - balik \n",
    "meroh merang - sangat merah \n",
    "senyak tuppah - senyap sunyi (tak ada bunyi langsung) \n",
    "boyyeh - buncit \n",
    "se'eh perok - sangat kenyang \n",
    "pendek keto' - sangat pendek \n",
    "tawo hebbe - sangat tawar \n",
    "serabut perok - sangat serabut (perasaan) \n",
    "maghi sokmo - datang selalu \n",
    "punoh jahanag/ punoh ranoh - rosak teruk \n",
    "agah - sombong \n",
    "supe tule - sama \n",
    "iseng - gila \n",
    "manih leting - sangat manis \n",
    "ngoyang - meroyam \n",
    "masang rebang/masang tuak/masang perik - sangat masam \n",
    "sapok jauh - sangat jauh  \n",
    "panah so oh - panas (bahang matahari)  \n",
    "panah sang - terasa sangat panas (marah)  \n",
    "panah ketik/panah dering - sangat panas (api/cahaya matahari)  \n",
    "sejuk serat/sejuk ketto - sangat sejuk \n",
    "comel lote - sangat comel  \n",
    "putih lepput - sangat putih  \n",
    "itang legang/itang letung - sangat hitam \n",
    "kelecak baghak - terpelanting  \n",
    "nipih nayyang - sangat nipis  \n",
    "sepoh woh - sangat bersepah \n",
    "besor bapok - sangat besar  \n",
    "besor gong - sangat besar  \n",
    "kece' tuweh - sangat kecil  \n",
    "ghengang lepong - sangat ringan  \n",
    "ketik nnyyamok - digigit nyamuk \n",
    "hok tule - yang sama \n",
    "dok sabboh -tak sesuai  \n",
    "besor gereguk - sangat besar  \n",
    "penoh nembok/penoh rumbu - sangat penuh sampai melimpah  \n",
    "kuruh kering - sangat kurus \n",
    "musing ligak - berpusing2 dengan laju \n",
    "seppoh woh - bersepah-sepah  \n",
    "puah - boring  \n",
    "puah sang - keboringan \n",
    "masang catung - tarik muka mucung 14 ( tunjuk muka masam) \n",
    "nakouk pahik - sangat penakut \n",
    "debbo' - sangat gemuk  \n",
    "dok rok meppeh - sangat2 tak larat  \n",
    "kepeh blepeng - sangat kempis  \n",
    "lapo perot - lapar (kata berangkai2, bila lapar, mesti selepasnya kena ada perut)  \n",
    "ngatok mate - mengantuk seghabuk perok - stress/tension  \n",
    "busuk bango/busuk kohong - sangat busuk (bau)  \n",
    "Mak Nga - cuai  \n",
    "babei - degil  \n",
    "Nellah pale bau - gelecet/kerkopak kulit kepala bahu  \n",
    "maha super bedel - mahal sangat \n",
    "gemok debo' - Sangat Gemuk \n",
    "bahang rambang - mengarut (contohnya buat kerja tak ikut prosidur/tak teratur)  \n",
    "takdok ngabih - sudah habis (memang dah tak ada)   \n",
    "suke glekek - ketawa yang teramat (menunjukkan sangat happy)  \n",
    "anguh lettong - sangat hangus (sampai hitam)  \n",
    "jluwah - comot  \n",
    "kupik/taik idong masing - kedekut  \n",
    "nyekik - menyampah  \n",
    "sikek - sikit\n",
    "Si agang - nasi dagang \n",
    "Woh Nyor - Buah Kelapa \n",
    "sekuk meri - biskut merrie\n",
    "auu gok - tak tahu lah \n",
    "dok dang starang - betul-betul tak sempat \n",
    "wak per pulok? - sebab apa pula? \n",
    "Doh Guaner Mung? - Dah kenapa kau? \n",
    "sabboh doh - sesuai dah \n",
    "takdok arroh - tak ada daya dah \n",
    "soheh dok mung? - kamu pasti ke?/betul-betul ke? \n",
    "bedo'oh - lebih-lebih \n",
    "bodo do'oh lalu - sangat bodoh \n",
    "nawok - tipu \n",
    "biar soheh - biar betul/ biar confirm \n",
    "gi selalu - pergi sekarang \n",
    "dok tau starang - tak tau langsung (starang tu perkataan menguatkan perkataan 'tak tau')  \n",
    "ape ke jadoh mung ning - apa ke hal kamu ni  \n",
    "takdok pekdoh - tak ada guna  \n",
    "dok auu - tak tahu   \n",
    "dulli mung - apa ko peduli \n",
    "guaner gamok? - Apa kahabar?  \n",
    "guaner balah? - macam mana?/apa cerita? \n",
    "tak dok guaner - tak ada apa-apa  \n",
    "tak mboh eh - tak nak lah \n",
    "awok-awok mung - kawan-kawan awak  \n",
    "puwok-puwok mung - kawan-kawan awak \n",
    "dok rok cettong - tak bo leh diharap \n",
    "tunggu tor - tunggu kejap (tor = Sebentar) \n",
    "takdok aghoh - habis ikhtiar  \n",
    "buleh pekdoh - dapat padah  \n",
    "kekgi - kejap lagi\n",
    "\"\"\""
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 2,
   "metadata": {},
   "outputs": [],
   "source": [
    "import malaya\n",
    "\n",
    "malays = malaya.texts._malay_words._malay_words"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 3,
   "metadata": {},
   "outputs": [],
   "source": [
    "import re\n",
    "from unidecode import unidecode\n",
    "\n",
    "def cleaning(string):\n",
    "    string = unidecode(string).replace('.', '. ').replace(',', ' , ')\n",
    "    string = re.sub('[^\\'\"A-Za-z\\-/ ]+', ' ', string)\n",
    "    string = re.sub(r'[ ]+', ' ', string.lower()).strip()\n",
    "    return string"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 4,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "174"
      ]
     },
     "execution_count": 4,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "words = []\n",
    "for line in additional.split('\\n'):\n",
    "    cleaned = cleaning(line)\n",
    "    if len(cleaned) < 3:\n",
    "        continue\n",
    "    c = cleaning(unidecode(line).split('-')[0]).replace('atau', '/').split('/')\n",
    "    \n",
    "    words.extend([cleaning(i) for i in c])\n",
    "    \n",
    "len(words)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 5,
   "metadata": {},
   "outputs": [],
   "source": [
    "additional = \"\"\"\n",
    "abih -- habis\n",
    "\n",
    "acing-perring - bau hancing\n",
    "\n",
    "aluh siat - terlalu halus\n",
    "\n",
    "amah - 50 sen, ie. samah(RM 0.50), dua amah(RM 1.00), tiga amah(RM1.50)\n",
    "\n",
    " \n",
    "\n",
    "B\n",
    "bah - bas\n",
    "\n",
    "bahang - pukul i.e. kena bahang - dipukul\n",
    "\n",
    "bahang gambang - tidak serius melakukan sesuatu\n",
    "\n",
    "bakpe - mengapa\n",
    "\n",
    "bang - azan\n",
    "\n",
    "basah jeruk - basah kuyup\n",
    "\n",
    "beng - memaksa diri\n",
    "\n",
    "berat nanang - terlalu berat\n",
    "\n",
    "bijok - pandai\n",
    "\n",
    "bira - tepi\n",
    "\n",
    "boh - banjir\n",
    "\n",
    "bok - buku\n",
    "\n",
    "bolok wok - berserabut\n",
    "\n",
    "bowok - bawa\n",
    "\n",
    "bekok cobong - bengkak yang teramat sangat, benjol\n",
    "\n",
    "beratah - keadaan yang amat banyak, ie. beratah anak ikan\n",
    "\n",
    "bewok - biawak\n",
    "\n",
    "blengah - melekit\n",
    "\n",
    "buak - buat\n",
    "\n",
    "bubuh - letak\n",
    "\n",
    " \n",
    "\n",
    "C\n",
    "cakduh - buat kerja dgn cuai\n",
    "\n",
    "cakna - ambil hirau, ambil tahu\n",
    "\n",
    "cakol - cangkul\n",
    "\n",
    "calor balor - tercalar\n",
    "\n",
    "carik - koyak\n",
    "\n",
    "ce'dung - bersawah\n",
    "\n",
    "ce'rok - jauh\n",
    "\n",
    "ce'rong - di sudut, di suatu tempat yang jauh\n",
    "\n",
    "cekoh - ie. cekoh buah durian = kupas/kopek buah durian\n",
    "\n",
    "ceroh-nerang - terang-benderang\n",
    "\n",
    "chamba - kusut\n",
    "\n",
    "cokoh - i.e. duduk cokoh -- berdiri atau duduk tapi tak duduk betul\n",
    "\n",
    "colok - batang mancis\n",
    "\n",
    "comel lote - sgt cantik\n",
    "\n",
    "cotek - sedikit\n",
    "\n",
    " \n",
    "\n",
    "D\n",
    "dang - sempat\n",
    "\n",
    "do'oh - melampau i.e. do'oh lalu- terlampau\n",
    "\n",
    "dok - tidak\n",
    "\n",
    "dok leh - tidak boleh\n",
    "\n",
    "dok rok cetong - letih, tidak bertenaga\n",
    "\n",
    "dok soh - tak perlu, jangan\n",
    "\n",
    "dok wie - tidak bagi\n",
    "\n",
    "dua amah - RM 1.00\n",
    "\n",
    " \n",
    "\n",
    "E\n",
    "ek - sombong\n",
    "\n",
    "esel - ensel pintu\n",
    "\n",
    " \n",
    "\n",
    "G\n",
    "gaha - menyental periuk atau kuali\n",
    "\n",
    "gajuk- beg plastik\n",
    "\n",
    "gandeng - pukul\n",
    "\n",
    "gandor - galas, seperti menggalas durian kepasar\n",
    "\n",
    "gelemang - penguat untuk geli, i.e. geli-gelemang\n",
    "\n",
    "gelenya - 1. ie. plastik gelenya(bag plastik pasar)(grocery plastic bag); 2. i.e. gatal-gelenya bermaksud miang\n",
    "\n",
    "geletik - gedik\n",
    "\n",
    "gemok mettong - terlalu gemok , juga \"gemok debok\",\n",
    "\n",
    "genyeh - gosok\n",
    "\n",
    "gere - ie. duduk atas gere\n",
    "\n",
    "go'coh - bergaduh\n",
    "\n",
    "gogeh - bergoyang\n",
    "\n",
    "gohek - memandu (asal dari 'go ahead')\n",
    "\n",
    "gong - bangga\n",
    "\n",
    "guane(v. ga'na) - bagaimana\n",
    "\n",
    "gumba - timba, ie. menimba ikan\n",
    "\n",
    "gerek - basikal\n",
    "\n",
    " \n",
    "\n",
    "H\n",
    "hangus letong - hangus habis\n",
    "\n",
    "hok - yang, yang mana, i.e. hok saya royak arituh- yang mana saya bagi tahu hari itu\n",
    "\n",
    " \n",
    "\n",
    "I\n",
    "ikan aye - ikan tongkol\n",
    "\n",
    "ikuk dang - tidak serius melakukan sesuatu\n",
    "\n",
    "itang legit - hitam sehitam arang\n",
    "\n",
    " \n",
    "\n",
    "J\n",
    "jahil tukil - terlampau bodoh, bengap\n",
    "\n",
    "jambang - tandas\n",
    "\n",
    "jala mas - sejenis kuih tradisional\n",
    "\n",
    "jambu golok - buah gajus\n",
    "\n",
    "je'put - cucur\n",
    "\n",
    "jenere - lena (tidur)\n",
    "\n",
    " \n",
    "\n",
    "K\n",
    "ka'bo - beritahu\n",
    "\n",
    "kaccik - segan/sanggap\n",
    "\n",
    "katok - pukul\n",
    "\n",
    "kawa - kopi, serbuk kawa - serbuk kopi\n",
    "\n",
    "kayu khamat - sejenih kuih tradisional seperti roti, kuih cakoi\n",
    "\n",
    "kecek tuek - terlalu kecil\n",
    "\n",
    "kekeng - mengankang\n",
    "\n",
    "kekgi - sekejap lagi\n",
    "\n",
    "kelih - lihat\n",
    "\n",
    "kemah keming - sempurna\n",
    "\n",
    "kerah ketung - terlalu keras\n",
    "\n",
    "keta teksi - teksi\n",
    "\n",
    "kepok gete/kepok gote/khepok gete - keropok lekor\n",
    "\n",
    "khabak - panjat\n",
    "\n",
    "koho-koho - beransur-ansur, ie. koho-koho doh ni\n",
    "\n",
    "kohong - i.e. busuk kohong - busuk yang teramat\n",
    "\n",
    "komang - (dari perkataan 'common')teruk, tidak bermutu\n",
    "\n",
    "korang-nyor - alat kukuran kelapa\n",
    "\n",
    "koyok - kupas buah\n",
    "\n",
    "kkudda - kekuda\n",
    "\n",
    " \n",
    "\n",
    "L\n",
    "\n",
    "\n",
    "lebong - tipu\n",
    "\n",
    "lecoh - becak\n",
    "\n",
    "lek lu - sabor dulu\n",
    "\n",
    "lekpong - adalah kata wacana\n",
    "\n",
    "lening - sekarang\n",
    "\n",
    "lembek - tilam\n",
    "\n",
    "leput - menguat perkataan warna putih, i.e putih leput\n",
    "\n",
    "liuk - lemau\n",
    "\n",
    " \n",
    "\n",
    "M\n",
    "makang pulut - kenduri, biasanya kenduri kahwin\n",
    "\n",
    "malah - malas\n",
    "\n",
    "maring - semalam\n",
    "\n",
    "mas jeput - sejenis makanan, kuih berwarna kuning\n",
    "\n",
    "masing pekok - masin teramat sangat\n",
    "\n",
    "mecheh - mancis\n",
    "\n",
    "mender - benda\n",
    "\n",
    "molek - sempurna, cantik, bagus\n",
    "\n",
    "mung - kamu, engkau, awak\n",
    "\n",
    "mMejed - masjid\n",
    "\n",
    " \n",
    "\n",
    "N\n",
    "\n",
    "nawok - tipu\n",
    "\n",
    "nebeng - melampau\n",
    "\n",
    "nengung - merenung/berfikir sejenak\n",
    "\n",
    "nganang - sejenis kuih yang amat manis, selalu dihidangkan selepas Sembahyang Terawih di bulan Ramadan\n",
    "\n",
    "ngatuk - mengantuk\n",
    "\n",
    "nganying - mempermain-mainkan, meniru gaya\n",
    "\n",
    "ngepong - bonceng motorsikal\n",
    "\n",
    "ngita - mengintai/skodeng\n",
    "\n",
    "noneng - tergantung yang menoneng\n",
    "\n",
    "noppat - lompat\n",
    "\n",
    "nusuk - sembunyi\n",
    "\n",
    "nyaknyer - (v. nyak nyer) - kesian -\" nyaknyer awang tu \" - kesian kat awang.\n",
    "\n",
    "nyaok - menyahut sapaan\n",
    "\n",
    "nyodok - penyodok\n",
    "\n",
    "nyor - kelapa, nyiur\n",
    "\n",
    " \n",
    "\n",
    "P\n",
    "panah dering - cuaca panas yang melampau\n",
    "\n",
    "patak - i.e. patak puyuk - bahagian bawah periuk, patak unjak - akar umbi\n",
    "\n",
    "parok - mahal, banyak\n",
    "\n",
    "pelang - mempelam\n",
    "\n",
    "peng - ais, cth: milo peng - milo ais\n",
    "\n",
    "piyer - siapa\n",
    "\n",
    "pitih - duit\n",
    "\n",
    "pieuu - penyu\n",
    "\n",
    "pong - pun\n",
    "\n",
    "plekong - baling/lempar\n",
    "\n",
    "prohong - berlubang\n",
    "\n",
    "pulok - pula\n",
    "\n",
    "pulut lepa - sejenis makanan tradiosional yang dibuat dari pulut, berbentuk silinder/rod dan dibungkus dalam daun pisang\n",
    "\n",
    "punoh - rosak\n",
    "\n",
    "puyuk - periuk\n",
    "\n",
    " \n",
    "\n",
    "R\n",
    "ralek - asyik\n",
    "\n",
    "reboh - rebah\n",
    "\n",
    "rege - riuh, bercakap banyak\n",
    "\n",
    "renyok - senget\n",
    "\n",
    "retek - juga, i.e. aku nok gih retek\n",
    "\n",
    "reti - mengetahui cara, pandai\n",
    "\n",
    "rezak - susah/payah\n",
    "\n",
    "robok - almari\n",
    "\n",
    "rodok - memasukkan sesuatu ke dlm lubang\n",
    "\n",
    "rohok - susah, payah\n",
    "\n",
    "rokrak - i.e. supik rokrak (grocery plastic bag)\n",
    "\n",
    "royak - beritahu\n",
    "\n",
    " \n",
    "\n",
    "S\n",
    "samah(v. se amah) - 50 sen\n",
    "\n",
    "sakok - terhalang\n",
    "\n",
    "sapang - sampan\n",
    "\n",
    "sapok - Jauh\n",
    "\n",
    "se'eh - terlalu kenyang\n",
    "\n",
    "sejuk ngoko - sangat sejuk\n",
    "\n",
    "sekeh - ie sekeh kepala\n",
    "\n",
    "sekok - tidak cukup ruang\n",
    "\n",
    "seme - semua\n",
    "\n",
    "seng - duit\n",
    "\n",
    "senyap tupah - membisu\n",
    "\n",
    "serek - selipar getah/ selipar jepun\n",
    "\n",
    "sepit - sempit\n",
    "\n",
    "sendar - lapik\n",
    "\n",
    "smete - manggis\n",
    "\n",
    "sohor - terkenal, glamour\n",
    "\n",
    "sokmo - sentiasa, selalu\n",
    "\n",
    "starang - Guna sebagai kata penguat(ie. dok tau starang abuk)\n",
    "\n",
    "stengba - bersiap sedia\n",
    "\n",
    "sumbakk - tersekat\n",
    "\n",
    "suka - ketawa, menyukai\n",
    "\n",
    "supit/supik - bag plastik\n",
    "\n",
    "susuk - sorok\n",
    "\n",
    " \n",
    "\n",
    "T\n",
    "tak mboh - tidak mahu\n",
    "\n",
    "tamboh - tambah\n",
    "\n",
    "tebeng - memaksa diri\n",
    "\n",
    "tekkang - tekanan\n",
    "\n",
    "tibang - pukul\n",
    "\n",
    "timung cina - tembikai\n",
    "\n",
    "togok - minum\n",
    "\n",
    "tohok - buang\n",
    "\n",
    "tok - nenek\n",
    "\n",
    "tokki - datuk\n",
    "\n",
    "tongong - bodoh, sbg satu penghinaan\n",
    "\n",
    "tonyoh - sekeh, ie tonyoh kepala\n",
    "\n",
    "tra - cuba, testing\n",
    "\n",
    "tranung - terengganu\n",
    "\n",
    "tubik - keluar\n",
    "\n",
    "tungggang-langgang - berterabur, tidak tersusun, bersepah\n",
    "\n",
    " \n",
    "\n",
    "U\n",
    "ubi - kentang\n",
    "\n",
    "ubi stele - keledek\n",
    "\n",
    "ulak - ulat\n",
    "\n",
    "ulor - ular\n",
    "\n",
    " \n",
    "\n",
    "W\n",
    "wak - buat\n",
    "\n",
    "wak lolok - tipu\n",
    "\n",
    "wi - beri\n",
    "\n",
    " \n",
    "\n",
    "\"\"\""
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 6,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "380"
      ]
     },
     "execution_count": 6,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "for line in additional.split('\\n'):\n",
    "    cleaned = cleaning(line)\n",
    "    if len(cleaned) < 3:\n",
    "        continue\n",
    "    c = cleaning(unidecode(line).split('-')[0]).replace('atau', '/').split('/')\n",
    "    \n",
    "    words.extend([cleaning(i) for i in c])\n",
    "    \n",
    "len(words)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 7,
   "metadata": {},
   "outputs": [
    {
     "data": {
      "text/plain": [
       "306"
      ]
     },
     "execution_count": 7,
     "metadata": {},
     "output_type": "execute_result"
    }
   ],
   "source": [
    "words = [i for i in words if len(i) > 3]\n",
    "    \n",
    "words = set(words) - malays\n",
    "len(words)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 8,
   "metadata": {},
   "outputs": [],
   "source": [
    "import json\n",
    "\n",
    "with open('terengganu-words.json', 'w') as fopen:\n",
    "    json.dump(list(words), fopen)"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": null,
   "metadata": {},
   "outputs": [],
   "source": []
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 3",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "codemirror_mode": {
    "name": "ipython",
    "version": 3
   },
   "file_extension": ".py",
   "mimetype": "text/x-python",
   "name": "python",
   "nbconvert_exporter": "python",
   "pygments_lexer": "ipython3",
   "version": "3.6.8"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 2
}
